Studie: Vergleich von automatisch erzeugten Alternativtexten
Liebe Teilnehmerin, lieber Teilnehmer,
im Rahmen des Projekts Stadt.Geschichte.Basel stellen wir historische Quellen und Forschungsdaten Open Access zur Verfügung. Ziel ist es, diese digitale Infrastruktur möglichst barrierearm zu gestalten, damit auch sehbehinderte und blinde Personen Zugang zu den visuellen Beständen erhalten.
Das Verfassen von Alternativtexten (Alt-Texten) für Bilder ist jedoch sehr aufwendig. Da uns die personellen Mittel für eine vollständige manuelle Erschliessung fehlen, untersuchen wir in dieser Vorstudie, ob multimodale KI-Modelle (Vision-Language Models) bei dieser Aufgabe unterstützen können.
Ziel der Studie
Wir testen, wie gut verschiedene KI-Systeme kurze, barrierefreie Bildbeschreibungen zu historischen Objekten erzeugen. Dazu wurden 20 repräsentative Bilder aus unterschiedlichen Epochen und Medientypen (Fotografien, Karten, Drucke, Objekte etc.) ausgewählt und mit ihren Metadaten an vier verschiedene Modelle übergeben.
Ihre Einschätzung hilft uns zu ermitteln, welches Modell sich am besten für den Einsatz in der historischen Forschung eignet.
Weitere Fragen der Studie sind, welche Kosten damit verbunden sind, und wie algorithmische Verfahren verantwortungsvoll in geisteswissenschaftliche Arbeitsprozesse integriert werden können. Die Ergebnisse werden auf der Computational Humanities Research Conference (CHR 2025) vom 9.–12. Dezember 2025 am Luxembourg Centre for Contemporary and Digital History (C²DH) vorgestellt.
Ablauf und Bewertungskriterien
Die Umfrage umfasst 20 Fragen und dauert etwa 10 bis 15 Minuten (ca. 30 bis 45 Sekunden pro Bild).
Auf jeder Seite sehen Sie ein Sammlungsbild und vier kurze Beschreibungen. Ordnen Sie die Beschreibungen von beste Beschreibung nach schlechteste Beschreibung per Drag & Drop. Alle Texte wurden automatisch generiert und können Fehler enthalten.
- den Kerninhalt sachlich und knapp wiedergeben,
- keine redundanten Angaben wie „Bild von …“ enthalten,
- wesentliche visuelle Merkmale (z. B. Personen, Objekte, Handlungen, Schrift) priorisieren,
- und nur dann Kontext liefern, wenn er zum Verständnis beiträgt.
- Weiterführende Links: 7 Regeln für gute Alt-Texte (nur lesen, falls Unklarheiten bestehen)
Tastatur: ↑/↓ verschiebt fokussierten Eintrag; 1–4 setzt direkt auf Position; Tab für Fokus.
Fokus-Indikator sichtbar. Elemente sind per ARIA ausgezeichnet.
Wir danken Ihnen herzlich für Ihre Zeit und Ihre fachliche Einschätzung. Sie leisten damit einen wichtigen Beitrag zu inklusiver, nachhaltiger und kritischer digitaler Geschichtsforschung.
Mit freundlichen Grüssen,
Dr. Moritz Mähr und Moritz Twente
Universität Bern / Universität Basel
Einwilligung und Start
Ihre Teilnahme ist freiwillig. Die personenbezogene Angabe (E-Mail-Adresse) dient ausschliesslich möglichen Rückfragen und wird nicht in die Forschungsdatenbank aufgenommen.
Verschiebe Elemente per Drag und Drop oder nutze Pfeiltasten. Beste Beschreibung nach oben.
Abschluss
Übermittlung…